草庐IT

python - Django Celery 任务记录

全部标签

python - 使用命名空间获取 lxml 标签属性

我的XML看起来像:......我有代码:fromlxmlimportetree...forterm_entryinroot.iterfind('.//termEntry'):printterm_entry.attrib['id']printterm_entry.nsmapforlang_setinterm_entry.iterfind('langSet'):printlang_set.nsmapprintlang_set.attribforsome_stuffinlang_set.iterfind('some_stuff'):...我得到空的nsmap字典,我的attrib字典看起来

python - 将 elementtree 转储到 xml 文件中

我用这样的东西创建了一个xml树top=Element('top')child=SubElement(top,'child')child.text='sometext'如何将其转储到XML文件中?我尝试了top.write(filename),但该方法不存在。 最佳答案 您需要实例化一个ElementTree反对并调用write()方法:importxml.etree.ElementTreeasETtop=ET.Element('top')child=ET.SubElement(top,'child')child.text='som

python - 清理 xml ==> 如果有空标签则删除行

我想清理我的xml,这样它不仅是有效的XML,而且以一种非常易于阅读的方式格式化。例如:Hello9.99我想删除所有带有空标签的行,留下:Hello9.99我尝试使用正则表达式执行此操作,但在以可读格式保留它方面运气不佳:txt=etree.tostring(self.xml_node,pretty_print=True)txt=re.sub(r'\n','',txt)完成上述任务的最佳方法是什么? 最佳答案 使用XML解析器。思路是findallemptynodes使用//*[not(node())]XPath表达式和remov

python - 解析包含默认命名空间的 xml 以使用 lxml 获取元素值

我有一个这样的xml字符串str1="""http://www.example.org/sitemap_1.xml.gz2015-07-01"""我想提取中存在的所有url节点即http://www.example.org/sitemap_1.xml.gz我试过这段代码,但没有字fromlxmlimportetreeroot=etree.fromstring(str1)urls=root.xpath("//loc/text()")printurls[]我试图检查我的根节点是否形成正确。我试过了,得到了与str1相同的字符串etree.tostring(root)'\n\nhttp://

python - 使用 Python 解析 XML 站点地图

我有这样的站点地图:http://www.site.co.uk/sitemap.xml其结构如下:http://www.site.co.uk/drag_it/dragitsitemap_static_0.xml2015-07-07http://www.site.co.uk/drag_it/dragitsitemap_alpha_0.xml2015-07-07...我想从中提取数据。首先我需要数一数有多少在xml中,然后为它们中的每一个提取和数据。有没有一种简单的方法可以在Python中执行此操作?我见过其他类似的问题,但它们都提取了例如每个xml中的元素,我需要从每个元素中单独提取数据

Python + 外籍人士 : Error on � entities

我写了一个小函数,它使用ElementTree和xpath来提取xml文件中某些元素的文本内容:#!/usr/bin/envpython2.5importdoctestfromxml.etreeimportElementTreefromStringIOimportStringIOdefparse_xml_etree(sin,xpath):"""TakesasinputastreamcontainingXMLandanXPathexpression.AppliestheXPathexpressiontotheXMLandreturnsageneratoryieldingthetextco

xml - 如何在 Python 中以简单的方式拆分 XML 文件?

我有用于将XML文件解析为detailedhere的Python代码.我知道XML文件因在内存中操作时占用系统资源而臭名昭著。我的解决方案适用于较小的XML文件(比如200KB,而我有一个340MB的文件)。我开始研究StAX(拉式解析器)实现,但我的日程安排很紧,我正在寻找一种更简单的方法来完成这项任务。我了解创建较小的文件block,但我如何通过每次输出main/header标签来提取正确的元素?例如,这是模式:............................................如何为每1000个书籍元素创建包含标题数据的新XML文件?代码和数据集的具体例子可以

xml - 在 XSLT 中对具有条件的记录进行计数

我有一个具有这种结构的xml:而且,我想计算host=yahoo.log的记录数。我知道我需要使用count(),但我不知道如何使用。 最佳答案 假设您位于emails元素上,这就是您可能想要的表达式例如,试试这个XSLT假设您的XML格式正确,并且您的CDATA标签格式正确,它应该输出3。 关于xml-在XSLT中对具有条件的记录进行计数,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questi

xml - Ant xmlproperty 任务。当有多个同名标签时会发生什么?

我正在尝试遵循已提供的大型ant构建文件,但在这种情况下我无法理解xmlproperty的功能。考虑这个xml文件,example.xml。file1machine1file2machine2在构建文件中,有一个任务可以简化为以下示例:据我了解,如果只有一个元素,我可以获得的内容与${PREFIX.main.tagList.tag.file}因为它大致相当于这样写:但是因为有两个s,${PREFIX.main.tagList.tag.file}的值是多少?在这种情况下?如果它是某种列表,我如何遍历值(value)观?我使用的是ant1.6.2。 最佳答案

python - soap 1.2 消息的 http header 中应该包含什么内容类型?

我有一个问题,我的xml-da客户端使用zsi2.2.2库生成看起来像soap1.2消息的消息,因为我可以看到这一行。xmlns:soapenv="http://www.w3.org/2003/05/soap-envelope"但我也可以在标题中看到text/xml作为内容类型。我找不到关于soap1.2中header应该是什么样子的任何概念,但我想它应该是application/soap-xml。那么它实际上应该是什么? 最佳答案 内容类型:application/soap+xml 关